深度Q-学习
Back to Home
01. 深度 Q 学习简介
02. 神经网络作为值函数
03. 蒙特卡洛学习
04. 时间差分学习
05. Q 学习
06. 深度 Q 网络
07. 经验回放
08. 固定 Q 目标
09. 深度 Q 学习算法
10. DQN 改进
11. 实现深度 Q 学习
12. TensorFlow 实现
13. 总结
Back to Home
09. 深度 Q 学习算法
深度 Q 学习算法
阅读延伸
Mnih et al.,2015 年,
《通过深度强化学习实现人类级别的控制》
(DQN 论文)
He et al. ,2015 年,
《深入研究纠正器:在 ImageNet 分类方面超过人类水平》
(权重初始化)
Next Concept